National Repository of Grey Literature 1 records found  Search took 0.01 seconds. 
Cross Lingual News Article Classification and Automatic Topic Discovery Using Multilingual Language Models
Dufková, Aneta ; Fajčík, Martin (referee) ; Kesiraju, Santosh (advisor)
Cílem této diplomové práce je provést mezijazykovou klasifikaci a automatickou detekci témat novinových článků s využitím předtrénovaných multijazykových modelů. Jelikož pro tento úkol nebyla k dispozici žádná vhodná datová sada, prvním přínosem této práce je vůbec takovou sadu vytvořit. Dalším krokem práce je porovnat multijazykové modely LaBSE a LASER2 v úloze klasifikace. K tomu je využita řada experiment zaměřených na trénování na omezeném počtu článků a samozřejmě testování na jazycích, které nebyly použity při tréninku. Poté je provedena automatická detekce témat, takže článek může být reprezentován nejen kategoriemi, ale také odpovídajícími slovy. Na závěr jsou výsledky popsaného procesu vizualizovány v podobě webové aplikace.

Interested in being notified about new results for this query?
Subscribe to the RSS feed.